Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) corpus disponibles (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: corpus disponibles


Is in goldstandard

1
paper CH_corpusRLAtxt32 - : Dentro de esta panorámica, aunque comparativamente de modo tardío, los estudiosos del español se han venido incorporando al campo de la LC en los términos actuales y han empleado las técnicas de recolección y construcción en cuestión. Un ejemplo interesante de acceso en línea y de modo gratuito lo constituye el trabajo que, en esta perspectiva, la Real Academia Española de la Lengua ha venido desarrollando. Ello se ha materializado en un sitio web con una interfaz de consulta de concordancias con dos corpus disponibles en línea: el Corpus de Referencia del Español Actual (CREA ), que alcanza cerca de 140 millones de formas y el Corpus Diacrónico del Español (CORDE), que consta de 180 millones de formas. También cabe destacar que la RAE a través de su Departamento de Lingüística Computacional se encuentra implementando herramientas de análisis lingüístico que se espera estén disponibles en línea en un futuro próximo.

2
paper CH_corpusSignostxt405 - : 5 El presente trabajo se centra exclusivamente en los ejemplos recogidos en el CORDE y el CREA y se descartan otros corpus disponibles como el CDH, el CORPES XXI o el Corpus del Español de Mark Davies, primero, porque el CDH es un corpus con orientación lexicográfica que no sirve como referencia para otros niveles de la lengua, por ello se descarta ; el CORPES XXI, tal y como se define, es una versión provisional en la que no figuran todavía transcripciones de textos orales y en el que se registra solo una pequeña parte de los documentos que lo conformarán, mismos que día con día se va actualizando (RAE, 2013), razón por la cual se ha planteado retomar la normalización de frecuencias para este corpus en trabajos posteriores; y por último, se descarta el Corpus del Español de Mark Davies de este estudio, ya que este corpus cuenta con un método de normalización de frecuencias por millón.

Evaluando al candidato corpus disponibles:



corpus disponibles
Lengua: spa
Frec: 9
Docs: 6
Nombre propio: / 9 = 0%
Coocurrencias con glosario:
Puntaje: 0.231 = ( + (1+0) / (1+3.32192809488736)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
corpus disponibles
: Corpus disponibles en línea